#define A(i, j) A[(i) + (j) * (LDA)]
#define B(i, j) B[(i) + (j) * (LDB)]
#define C(i, j) C[(i) + (j) * (LDC)]
// mm 的最朴素版本
// A:[M, K] B:[K, N] C:[M, N]
inline void mm_v1(int M, int N, int K, double *A, int LDA, double *B, int LDB,
                  double *C, int LDC) {

    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
            for (int k = 0; k < K; k++) {
                C(i, j) += A(i, k) * B(k, j);
            }
        }
    }
}
#undef A
#undef B
#undef C
